标签噪声:在监督学习等任务中,训练数据的标签(label)存在错误、模糊或不一致的现象(例如把“猫”的图片标成“狗”)。它会降低模型性能,并可能导致模型学到偏差。该术语也可更广义地指任何来自标注过程的“带标签错误”。
The dataset has label noise because some images are mislabeled.
这个数据集有标签噪声,因为有些图片被标错了。
Label noise can cause a model to overfit incorrect annotations, so we used robust training methods to reduce its impact.
标签噪声可能让模型过拟合错误标注,因此我们使用了更鲁棒的训练方法来降低其影响。
/ˈleɪbəl nɔɪz/
label 原指“贴在物品上的标签”,在机器学习语境中引申为“样本的类别/目标值(标签)”;noise 意为“噪声、干扰”。合起来的 label noise 字面即“标签里的干扰”,指标注信息不干净、带错误或随机扰动的情况,是数据质量问题的一种常见表述。